AI资讯新闻榜单内容搜索-LLM

LeCun力荐的JEPA杀入LLM，用CV的思路训练LLM，性能鲁棒性双丰收

LeCun 这次不是批评 LLM，而是亲自改造。当前 LLM 的训练（包括预训练、微调和评估）主要依赖于在「输入空间」进行重构与生成，例如预测下一个词。而在 CV 领域，基于「嵌入空间」的训练目标，如联合嵌入预测架构（JEPA），已被证明远优于在输入空间操作的同类方法。

来自主题: AI技术研报

8553 点击 2025-09-23 10:12

IBM发布LLM工具调用判断器ToolRM，工具调用准确率提高25%

Tool-Calling作为Agent的核心模块，智能体的双手，这项关键能力允许 LLM 调用外部函数，例如应用程序接口（APIs）、数据库、计算器和搜索引擎，决定了AI Agent的可执行边界。

来自主题: AI技术研报

9150 点击 2025-09-22 10:34

Meta开源MobileLLM-R1模型，不到1B参数，用1/10的训练就超越了Qwen3

本周五，Meta AI 团队正式发布了 MobileLLM-R1。这是 MobileLLM 的全新高效推理模型系列，包含两类模型：基础模型 MobileLLM-R1-140M-base、MobileLLM-R1-360M-base、MobileLLM-R1-950M-base 和它们相应的最终模型版。

来自主题: AI技术研报

9686 点击 2025-09-14 11:16

腾讯优图重磅开源Youtu-GraphRAG，实现图检索增强技术新突破

图检索增强生成（GraphRAG）已成为大模型解决复杂领域知识问答的重要解决方案之一。然而，当前学界和开源界的方案都面临着三大关键痛点：开销巨大：通过 LLM 构建图谱及社区，Token 消耗大，耗

来自主题: AI技术研报

10047 点击 2025-09-14 10:45

她们估值840亿，刚发了第一个AI成果

刚刚，0产出估值就已冲破120亿美元的Thinking Machines，终于发布首篇研究博客。

来自主题: AI技术研报

7467 点击 2025-09-11 17:21

一句“吴恩达说的”，就能让GPT-4o mini言听计从

人类心理学说服策略可以有效迁移至LLM 你有没有试过让ChatGPT骂你一句？（doge）它大概率会礼貌拒绝：私密马赛，我不能这样做orz 但最新研究表明，只需要擅用一点人类的心理技巧PUA，AI就会乖乖（骂你）听话。

来自主题: AI资讯

9743 点击 2025-09-02 11:28

那天，AI大模型想起了，被「失忆」所束缚的枷锁

记忆，你有我有，LLM 不一定有，但它们正在有。

来自主题: AI技术研报

9719 点击 2025-09-01 10:38

LLM也具有身份认同？当LLM发现博弈对手是自己时，行为变化了

LLM 似乎可以扮演任何角色。使用提示词，你可以让它变身经验丰富的老师、资深程序员、提示词优化专家、推理游戏侦探…… 但你是否想过：LLM 是否存在某种身份认同？

来自主题: AI技术研报

7014 点击 2025-09-01 10:10

Agentic Deep Research新范式，推理能力再突破，可信度增加，蚂蚁安全团队出品

尽管 LLM 的能力与日俱增，但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制，突破 AI 能力界限，业界研究者们提出了 Agentic Deep Research 系统，在该系统中基于 LLM 的 Agent 通过自主推理、调用搜索引擎和迭代地整合信息来给出全面、有深度且正确性有保障的解决方案。

来自主题: AI技术研报

8333 点击 2025-08-27 17:05

Coinbase强制全员上手AI工具，拒绝者直接开除

LLM 发展至今，编程能力已经非常强大，成为了很多开发者和软件工程师的「标配」，甚至谷歌还曾宣称其 50% 的代码都是 AI 编写的。

来自主题: AI资讯

8925 点击 2025-08-23 16:17